Авторы |
Огнев Иван Васильевич, доктор технических наук, профессор, кафедра вычислительной техники, Национальный исследовательский университет «Московский энергетический институт» (Россия, г. Москва, ул. Красноказарменная, 14), OgnevIV@mpei.ru
Парамонов Павел Александрович, аспирант, Национальный исследовательский университет «Московский энергетический институт» (Россия, г. Москва, ул. Красноказарменная, 14), pa.pawka@gmail.com
|
Аннотация |
Актуальность и цели. Актуальность и цели. В основе применения скрытых марковских моделей лежат рекурсивные процедуры, обладающие вычислительной сложностью. При этом от систем автоматического распознавания речи часто требуется, чтобы они работали в режиме реального времени, поэтому повышение;быстродействия для таких систем является актуальной задачей.
Материалы и методы. Одним из путей решения данной задачи является реализация аппаратной поддержки вычислений в ассоциативной осцилляторной среде. Она обладает малыми аппаратными затратами из-за простоты базовых клеточных ансамблей и выполняемых ими функций и высоким быстродействием, не зависящим от длины наблюдаемой последовательности и количества состояний скрытых марковских моделей, благодаря массовому параллелизму и конвейерному характеру вычислений.
Результаты. Предложена аппаратная реализация вычисления функции вероятности прямого распространения в среде. В пакете Matlab составлена программная модель, с помощью которой была экспериментально оценена точность результата вычисления в ассоциативной осцилляторной среде на примере распознавания русских слов.
Выводы. Полученная оценка точности результата на примере распознавания русских слов показала эффективность используемой модели.
|
Список литературы |
1. Becchetti, C. Speech Recognition. Theory and C++ Implementation / C. Becchetti, L. P. Ricotti. – Wiley, 1999. – 428 p.
2. Huang, X. Spoken language processing: a guide to theory, algorithm, and system development / X. Huang, A. Acero. – Prentice Hall, 2001. – 1008 p.
3. Mosleh, M. FPGA implementation of a linear systolic array for speech recognition based on HMM / M. Mosleh, S. Setayeshi, M. Mehdi Lotfinejad, A. Mirshekari // The2nd International Conference on Computer and Automation Engineering (ICCAE). – 2010. – Vol. 3. – P. 75–78.
4. Огнев, И. В. Предварительная обработка речевого сигнала для построения базы произношений одиночных слов / И. В. Огнев, П. А. Парамонов // Информационные средства и технологии : тр. XX Междунар. науч.-техн. конф. – М. : МЭИ, 2012. – С. 53–58.
5. Ognev, I. V. The use of extrema distribution as a feature vector for speech patterns recognition / I. V. Ognev, A. I. Ognev, P. A. Paramonov, N. A. Sutula // Pattern Recognition and Image Analysis: New Information Technologies : the 11th International Conference. – 2013. – Vol. 1. – P. 114–117.
6. Rabiner, L. Fundamentals of speech recognition / L. Rabiner, B.-H. Juang. – Prentice Hall, 1993. – 507 p.
7. Рабинер, Л. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор / Л. Рабинер // Труды института инженеров по электротехнике и радиоэлектронике. – М. : Мир, 1989. – Т. 77, № 2. – С. 86–120.
8. Комаров, А. Н. Исследование и разработка ассоциативных сред и методов обработки информации : дис. … канд. техн. наук / Комаров А. Н. – М. : МЭИ(ТУ), 2002. – 194 с.
9. Комаров, А. Н. Базовые клеточные ансамбли ассоциативных осцилляторных сред и возможности их расширения / А. Н. Комаров, И. В. Огнев, П. Б. Подолин //
Вычислительные системы и технологии обработки информации : межвуз. сб. научн. тр. – Вып. 5 (30). – Пенза : Инф.-изд. центр ПГУ, 2006. – 200 с.
10. Огнев, И. В. Распознавание символов в ассоциативной осцилляторной среде / И. В. Огнев, П. Б. Подолин // Известия высших учебных заведений. Поволжский регион. Сер. Технические науки. – 2006. – № 6. – С. 55–66.
|